Bandits Lineales Estocásticos: Casi Óptimos con Retraso
Descubre cómo el retraso en la retroalimentación afecta a los algoritmos de bandits lineales. Resultados casi óptimos con penalizaciones aditivas o
Descubre cómo el retraso en la retroalimentación afecta a los algoritmos de bandits lineales. Resultados casi óptimos con penalizaciones aditivas o